邏輯回歸是機器學習裡要解決的基本問題。如下圖:
就是給一個特徵向量及答案的組合,這些資料給機器作學習,未來可以拿某個特徵向量問機器,請它做答案的預測。
用在電影推薦上,我們可以把使用者和電影的及評分表給機器學習, 日後只要問機器,某使用者對某部電影評分的話,他會評幾分?只要能預測出來,我們就能夠知道一部電影要不要推薦給這個人了。
推薦問題變成可以用邏輯回歸來解決。
那要怎麼做?
把之前的討論 協作過濾的評分表拿來做例子。評分表是2維的,一維是使用者,一維是電影,如下圖:
將使用者編碼如下:
電影編碼如下:
最後就可以變成
評分若是5分的,這就變成分成5類問題。若把4~5分為一類,1~3分為一類,這樣就變成 2 分類的問題。
接著就可以用原本機器學習的方式,來預測某個人對某部電影會不會想看
用這個方法還有其它的好處
可以再把其它的特徵放進來訓練,例如:
例如:
今天,我們用用機器學習的方式,把特徵向量組合及最後的評分組合起來,讓推薦問題就變成了分類問題。
但,矩陣稀疏會影響效果,接下來會介紹其它的解法,進一步解決稀疏的影響。